工程实现系列:从什么都不会到QLoRA分布式DPO(一)1 引言 领导看了几篇营销号推文,突然要求在有限的算力上部署和微调大模型。当你开始研究,却发现眼前摆着一堆框架和工具,你好不容易理清楚了发现无从下手: - 训练框架:accelerate、deepspeed、llamafactory、megatron、unsloth... - 部署方案:vllm、o...